import pandas as pd

cc=pd.read_parquet('20251109.parquet')
# 打印列名以确认字段存在
print("数据列名:")
print(list(cc))

# 检查BinFileName字段是否存在，如果不存在可能需要使用其他相关字段
if 'BinFileName' in cc.columns:
    # 按照source_line和BinFileName聚合统计数量
    aggregation_result = cc.groupby(['source_line', 'BinFileName', 'Class']).agg(
        count=('source_line', 'size'),
        Eta_avg=('Eta', 'mean'),
        isc_avg=('Eta', 'mean'),
        ff_avg=('FF', 'mean'),
        uoc_avg=('FF', 'mean'),
        rsh_avg=('Rshunt', 'mean'),
        rse_avg=('Rser', 'mean'),
        irev2_avg=('Irev2', 'mean')
    ).reset_index()

    print("\n按照source_line和BinFileName聚合统计结果:")
    print(aggregation_result)
    aggregation_result.to_csv('aggregation_result.csv', index=False,encoding='gbk')

